Machine Learning: Regressão Logística



O que é uma Regressão Logística



    A Regressão Logística é uma regressão múltipla, mas com uma variável de saída categórica binária (dependente) e variáveis preditivas (explicativas ou independentes) contínuas ou categóricas. Quando a variável dependente é binária (como sim/não), não podemos usar a regressão linear. Optamos por isso por uma transformação logarítmica e procedemos para a analisar o grau preditivo da(s) variável(is) independente(s).



Caraterísticas



    Na regressão logística, as variáveis dependentes estão dispostas em categorias (sim/não; alto/baixo), enquanto na regressão linear estas variáveis são contínuas.


    A resposta na regressão logística é expressa através de uma probabilidade de ocorrência, enquanto na regressão simples, obtém-se um valor numérico.


    Por isso, a regressão logística apresenta-se como um método da determinação da probabilidade de ocorrência dos valores preditos de uma variável dicotómica.


    Na regressão logística as variáveis independentes podem ser fatores ou covariantes (dados contínuos).


    As variáveis dependentes poderão estar dispostas em duas categorias (Regressão Logística Binária) ou mais categorias.